rank | frequency | n-gram |
---|---|---|
1 | 756 | -ー |
2 | 661 | -る |
3 | 636 | -ン |
4 | 536 | -い |
5 | 460 | -り |
rank | frequency | n-gram |
---|---|---|
1 | 128 | -ット |
2 | 123 | -ング |
3 | 116 | -ール |
4 | 113 | -ック |
5 | 101 | -ター |
rank | frequency | n-gram |
---|---|---|
1 | 53 | -ション |
2 | 47 | -ックス |
3 | 26 | -ーター |
4 | 26 | -ィング |
5 | 23 | -リング |
rank | frequency | n-gram |
---|---|---|
1 | 29 | -ーション |
2 | 14 | -ティング |
3 | 11 | -ディング |
4 | 10 | -tion |
5 | 7 | -ッション |
rank | frequency | n-gram |
---|---|---|
1 | 7 | -ジャケット |
2 | 7 | -アスリート |
3 | 5 | -レーション |
4 | 5 | -テーション |
5 | 4 | -プログラム |
The tables show the most frequent letter-N-grams at the ending of words for N=1…5. Everything runs in parallel to 2.2.5 Most frequent word beginnings. The aim is suffix detection instead of affix detection.
For N=3:
SELECT @pos:=(@pos+1), xx.* from (SELECT @pos:=0) r, (select count(*) as cnt ,concat("-", right(word,3)) FROM words WHERE w_id>100 group by right(word,3) order by cnt desc) xx limit 5;
2.2.5 Most frequent word beginnings